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摘 要 : 大 数据 环境 下 ， 移 动 众 包 模 式 的 研究 成 为 热点 。 为 提高 移动 众 包 系统 的 有 效 性 和 可 靠 性 ， 设 计 了 一 套 完 整 的 
在 线 激励 机 制 优化 算法 ， 针 对 用 户 到 达 和 参与 任务 的 异步 行为 ， 提 出 一 种 改进 的 多 阶段 反 向 拍卖 算法 ， 通 过 在 线 学 习 
自 适 应 确定 “密度 阔 值 ” 动态 选择 最 优 用 户 集 ， 并 在 每 次 交易 后 对 用 户 的 信誉 进行 更 新 ， 以 指导 下 次 任务 分 配 。 仿 真 
结果 表明 ， 该 优化 算法 满足 计算 有 效 性 、 利 益 双 方正 收益 性 和 真实 性 ， 能 在 一 定 预算 和 时 间 约束 下 获得 更 好 的 性 能 。 
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Optimization algorithm of online incentive mechanism for mobile crowdsourcing system 


Zhang Yongtang'? 
(1. Dept. of Computer Science & Technology Guangdong Neusoft Institute, Foshan Guangdong 528225, China; 2. Guangdong 
Key Laboratory of Big Data Analysis & Processing, Guangzhou 510006, China) 


Abstract: The study of mobile crowdsourcing system has become a hotspot in big data environment. In order to improve the 
validity and reliability of mobile crowdsourcing system, a complete optimization algorithm of online incentive mechanism is 
designed. For the asynchronous behavior of users arriving and participating in tasks, an improved multi-stage reverse auction 
algorithm is proposed. Through online learning Adaptively determine the "density threshold", dynamically select the optimal 


user set, and update the user's reputation after each transaction to guide the next task assignment. The simulation results show 


that the optimization algorithm can meet the computational efficiency and the profitability and authenticity of both parties, and 
can achieve better performance under certain budget and time constraints. 
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= 合用 户 随机 到 达 和 离开 的 异步 现实 场景 。 近 两 年 ， 设 置 固定 立 
3 值 的 异步 在 线 拍卖 算法 首先 被 提出 ， 之 后 Zhang 等 人 外 提出 二 
众 包 0 是 互联 网 带 来 的 一 种 分 布 式 问题 解决 模式 。 近 年来， 阶段 拍卖 算法 ， 拒 绝 并 以 第 一 阶段 提交 竞价 的 用 户 信 息 作 为 参 

随 着 移动 设备 的 普及 和 无 线 通信 技术 的 快速 发 展 , 移动 众 包 [1] 。 考 ,但 这 对 早 到 的 用 户 有 失 公平 性 ， Wang 等 人 四 提出 结合 信誉 

的 概念 应 运 而 生 。 用 户 可 以 利用 智能 设备 内 置 的 丰富 传感器 和 更 新 和 隐私 保护 的 在 线 激励 机 制 ， 但 其 将 众 包 任务 完全 以 感知 

强大 的 存储 、 计 算 能 力 随时 随地 参与 众 包 任务 ， 任 务 请 求 者 和 ”时 间 衡量 ， 限 制 了 应 用 场景 ，Zhao 等 人 四 提出 多 阶段 拍卖 算法 

用 户 之 间 也 可 以 通过 Wi-Fi、 蓝 牙 或 D2D 等 无 线 网 络 技术 直接 。 的 思想 ， 但 未 充分 考虑 利益 双方 违约 的 情况 。 本 文 在 参考 前 人 


a 


通信 ， 弱 化 了 基站 和 众 包 平 台 的 干预 ， 更 好 的 进行 资源 共享 和 ”” 研究 的 基础 上 ， 针 对 更 加 真实 的 用 户 异 步 移动 场景 ， 提 出 一 套 
任务 协作 。 与 传统 的 基于 Web 的 众 包 模式 不 同 , 移动 众 包 系 统 ”完整 的 在 线 激励 机 制 ， 包 括 改进 的 多 阶段 反 向 拍卖 算法 和 信誉 
具有 更 强 的 实时 性 和 移动 性 ， 因 此 不 能 用 己 有 的 离线 算法 解决 ” 更 新 算法 ， 理 论 和 仿真 结果 证 明 ， 该 激励 机 制 优化 算法 满足 计 
相关 问题 。 算 有 效 性 、 利 益 双 方正 收益 性 和 真实 性 ， 同 时 能 在 一 定 的 时 间 
于 用 户 参与 众 包 任务 必然 会 消耗 移动 设备 的 资源 和 电量 ， ”和 预算 约束 下 获得 更 好 的 性 能 。 

人 里 位 因此 ， Ws ed 1 ”系统 模型 

为 重要 。 已 有 的 关于 用 户 招募 和 激励 的 研究 大 多 基于 离线 同 

步 场景 ， 通 过 Stackelberg 博弈 中 或 贪 禁 搜 索 的 算法 中选 择 最 优 假设 候选 用 户 集 C= 世 2… 才 ， 任 务 集 8 ={9,9…9,}) ， 任 
用 户 集 , 但 其 要 求 所 有 人 同时 提交 竞价 或 彼此 信息 公开 ， 不 适 务 请 求 者 在 某 时 某 地 发 布 任务 信息 (包括 截止 时 间 7 和 预算 8 )， 
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到 达 的 用 户 根据 个 人 兴趣 提交 竞价 (包括 期 待 报酬 5 和 贡献 值 
v; )， 用 户 i 完成 此 任务 对 应 的 花费 为 c; ， 当 前 信誉 值 为 *。 每 
收 到 一 个 用 户 的 竞价 信息 ， 任 务 请 求 者 需 立 即 决定 是 否 接受 该 
用 户 ， 若 # 则 发 放 报 酬 p; 并 进行 交易 。 交 易 结 束 ， 根 据 任 
务 完成 质量 对 该 用 户 的 信誉 值 进行 更 新 。 故 参与 任务 的 每 个 用 
户 二 的 效益 函数 为 


总 


思 
妆 
NN 


ifieS 


else 


| 疡 一 人 
= (1) 


定义 任务 请 求 者 的 实际 效益 为 


其 中 S 代 表 已 选用 户 集 。 


vs) -zs(1+ 0 )-r08) (2) 


其 中 Y(S)= 2w ，P(S)= 和 Pp ，4 为 系统 任务 参与 者 的 数量 ,该 
单调 子 模 函 数 反映 了 经 济 学 中 边际 效益 递减 的 趋势 ， 适 用 于 很 
多 现实 场景 。 每 个 用 户 i 为 任务 请 求 者 提供 的 实际 边缘 效益 为 
u =U(SUi)-U(S) 
-al al 上 3 
式 (3) 用 来 衡量 用 户 的 实际 个 人 贡献 。 基 于 此 ， 本 文 的 


标 是 设计 一 套 合理 的 在 线 激励 机 制 ， 
大 化 系统 效益 ， 即 
MaximizeU (S)subject toP(S)< Bandt <7 


能 在 预算 和 时 间 约 束 下 最 


(4) 
2 ”算法 设计 
2.1 改进 的 多 阶段 反 向 拍卖 算法 
针对 上 述 系统 模型 ， 本 文 首先 提出 改进 的 多 阶段 反 向 拍卖 
算法 ,将 任务 过 程 按 截止 时 间 7 分 为 多 个 阶段 ， 动 态 增 加 样本 ， 
通过 在 线 学 习 的 方式 实时 更 新 每 个 阶段 的 “密度 阔 值 ”Ml, 用 
于 对 下 一 阶段 进行 决策 。 由 于 阔 值 的 计算 结合 了 用 户 的 实际 情 
况 ， 可 以 自 适 应 地 调整 至 最 优 ， 改 善 了 人 为 设置 的 不 确定 和 不 
合理 性 。 同时 , 初始 化 一 个 任务 请 求 者 可 以 接受 的 较 小 闵 值 来 
指导 第 一 阶段 的 决策 , 这样 第 一 阶段 的 用 户 也 有 机 会 赢得 拍卖 ， 
且 鼓 励 用 户 尽早 到 达 ， 解 决 了 二 阶段 拍卖 算法 的 不 公平 问题 
改进 的 多 阶段 在 线 反 向 拍卖 算法 如 下 : 
Input: budget B,deadline 7 
Initialize: B=| 2B/20e |; 
T=|2°7/2" | ;1=1; 
S=@;P=5;U(S)=0; 
1<T do 


P(S)=0 
while 
if there is a user 1 arriving attime step then 
b=b,;v=v,;u =U(SUi)-U(S); 
If bzu/psB'-P(S) then 
pb;SeSufi; 
U(S)€U(S)+u; P(S)¢P(S)+p,; 
Else 
end if 
让 t=7T" 


then 


hine 
张 永 棠 : 一 种 移动 众 包 系统 


p=U(S)/(6*P(S)); 
B' 2B' ;Te2T; 
end 让 
tt+l; 
end while 
2.2 真实 的 在 线 信 
任务 请 求 者 和 


誉 更 新 算法 


获得 更 高 的 效益 ,因此 会 出 现 “ 违 
例 对 用 户 端 设 置 奖惩 激励 ， 
为 用 户 i 当前 信誉 值 ，# 为 


其 完成 任务 


户 的 交易 行为 分 为 先 付 报酬 和 先 完成 任务 
两 种 情况 。 考 虑 个 体 的 自私 性 ， 双 方 均 倾向 于 损失 更 小 的 花费 
圳 约 ” 行 为 四 。 本 文 以 情况 一 为 
情况 二 对 任务 请 求 者 同 理 。 假 设 
k 之 后 的 信 


誉 值 。 定 义 


max 为 系统 用 户 信誉 的 最 大 值 ， 各 任务 要 求 的 信誉 值 集合 为 


90={9,9,…,0,} ， 其 中 是 系统 最 低 信誉 
分 别 对 应 任务 9.,9,…， 
4=(good,bad) 代表 用 户 在 本 次 任务 中 选择 
用 户 i 在 完成 任务 之 后 的 信 


六 值 ， 0,@,.…， 
9 的 信誉 阐 值 ， 
可 信 / 不 可 信 策略 。 则 
誉 更 新 算法 如 下 : 


0, > 


0<0<10 。 定 义 


min (7 +l, eo gq=go00d,r* ">0, 

0. -1, if qg=bad,r ">0.,0. >0, 
mb， if gq=bad,r:" >0.,0, =0, (5) 
| 和 if g=bad,n" =0.,0, >0, 

0, -1 if gqg=bad,r "=0.,0, =0, 

po 证 te! 0. 


可 以 看 出 ， 若 
会 受 损 ， 但 还 有 机 会 通过 完成 
只 有 信誉 值 低 于 系统 阔 值 才 会 
务 。 该 方法 可 以 有 效 激励 用 户 按 真实 的 报 
免 了 设置 单 


3 “仿真 结果 与 分 析 


户 在 某 次 交易 中 选择 了 不 可 信行 为 ， 信 淮 
其 他 要 求 较 低 的 任务 进行 弥补 ， 
被 系统 驱逐 ， 不 能 再 


参与 任何 任 
价 完成 任务 ， 同 时 避 


闷 值 的 传统 信誉 更 新 方法 中 的 过 度 惩罚 问题 。 


3.1 改进 的 多 阶段 反 向 拍卖 算法 仿真 结果 及 分 析 
编写 MATLAB 程序 ， 设 置 任务 截止 时 间 7T=8min ， 预 算 


和 密度 阔 值 P=12 。 


=80 ,用 户 的 到 达 时 间 服从 到 达 率 为 0.6 的 泊 松 分 布 四， 用 户 
价 和 贡献 值 均 随机 分 布 在 1-10 的 范围 内 , 系统 任务 参与 者 数 
与 设置 


固定 密度 阔 值 p=1/2 


的 普通 在 线 拍卖 算法 作对 比 ， 每 个 实验 独立 运行 50 次 取 平 均 


值 。 仿 真 结果 如 图 1 所 示 。 


多 阶段 拍卖 算法 
一 一 一 - 普通 拍卖 算法 


0 10 20 30 40 50 
支付 报酬 P(S) 


(a) 算法 性 能 对 比 


60 70 80 
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B=80 T=8min B= te 才 0 B=100,T=16min 
Cb) 算法 时 间 对 比 
图 1 改进 的 多 阶段 反 向 拍卖 算法 仿真 结果 
从 图 1 可 以 看 出 ， 本 文 提出 的 多 阶段 拍卖 算法 在 效益 和 时 
间 上 都 比 传统 的 在 线 拍卖 算法 更 胜 一 筹 。 事 实 上 ， 若 传统 算法 


选择 合适 阔 值 ， 可 以 达到 与 本 算法 相近 的 性 能 ， 但 人 工 选 取 阔 


值 


的 交 


Be 


时 间 ， 这 也 是 该 算法 付出 的 
足 的 情况 ， 该 时 间 消 耗 可 忽 
单一 改变 截止 时 间 了 、 
能 进行 仿真 比较 ， 


性 


非常 


困难 ， 这 也 是 本 算法 的 优点 之 一 。 
序 运 行 时 间 代 表 交 易 时 间 ， 说 日 


多 


妈 1(b) 所 示 的 程 
多 阶段 拍卖 算法 可 以 通过 更 少 


交易 次 数 获得 更 高 的 效 
量 损耗 。 但 在 现实 场景 中 ] 


巨 绝 用 户 和 等 待 新 用 


益 ， 从 全 局 角度 优化 了 任 
户 到 达 


务 效率 和 
也 需要 


代价 。 考 虑 人 口 密集 、 
各 不 计 。 


实际 效益 CCS) 


实际 效益 U(S) 
t 


结果 如 图 


实际 效益 CS) 


3 5 
时 间 阶 段 数 工 ， 


(a) 截止 时 间 7 的 影响 


20 30 40 50 60 80 
预算 B 


(b) 预算 B 的 影响 


Py 久光 


04 
用 户 到 达 率 r 


0.6 0.8 1 


(c) ”到 达 率 7+ 的 影响 


图 2 单一 任务 信息 对 实际 效益 的 影响 


参与 用 


户 充 


任务 预算 B 和 用 户 到 达 率 7 对 算法 
2 所 示 。 


90 100 


从 图 2 可 以 看 
到 达 率 越 高 , 任 
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况 都 对 应 可 
步 证 明 


以 
了 


进 
3.2 


者 选择 可 信用 户 


收益 矩阵 分 析 
0.3 至 0.9， 


户 行 为 演化 趋势 如 医 


HH， 给 定 的 预算 越 大 ， 截 止 时 间 越 长 ， 用 
务 请 求 者 最 终 的 实际 效益 越 大 。 因为 这 三 种 | 


合集 项 列 。 


户 


性 
局 


招募 更 多 的 优质 用 户 参 与 任务 ， 符 合 实际 情况 ， 


算法 的 合理 


， 双 方 收益 


纳什 均衡 09， 


性 。 
在 线 信誉 更 新 算法 仿真 结果 及 分 析 
本 文 首先 结合 演化 博 奔 理 
户 的 行为 演化 趋势 ， 利 益 双方 的 
为 一 
户 ， 双 方 收益 为 -~p; ，p;; 拒绝 用 


E 论 


Pp: 


二 认 


户 则 双方 收益 为 0。 根 据 上 


9 分 析 移 动 众 包 系统 中 可 
妇 益 情况 为 : 


J 
， Pi 一 0; 夏 


言 用 
若 任务 请 求 
选择 非 可 


设置 系统 中 初始 可 信 


名 


步 长 为 0.1， 用 户 习 
3 所 示 。 


均 报 本 


户 比 例 


和 花费 为 5 和 2。 


可 


从 图 3 可 


用 户 趋 于 选择 非 可 


演化 代数 


言 誉 更 新 算 
最 小 信誉 闵 值 


单一 阔 


设 


3 可 信 
以 看 出 ,在 初始 可 信用 
信 策略 ， 所 
法 进行 仿真 ， 初 始 化 可 
分 别 为 =6,7,8,9 ， 
值 的 信 


户 演化 趋势 
户 比 例 小 
以 有 必要 进行 奖惩 


全 


誉 更 新 算法 作对 比 ， 


信用 户 数量 


务 上 的 要 求 闪 值 和 =9 。 


0.6 


的 情况 下 ， 
激励 。 对 提出 
为 100， 系 统 
与 


结果 如 图 


10 15 
交易 时 间 序 列 


4 在 线 信誉 更 新 算法 性 


能 对 比 


4 所 示 。 


从 图 4 可 以 看 出 ,新 的 信誉 更 新 算法 对 用 户 的 包容 度 更 大 ， 


可 使 可 信用 户 数量 稳定 在 一 人 
而 传统 算法 中 用 户 
在 的 可 信用 户 造 成 过 度 惩罚 。 
4 ”结束 语 

本 文 针对 


个 较 高 比例 ,更 好 地 维持 系统 运行 。 
次 不 可 信行 为 便 会 被 系统 驱逐 


， 容 易 对 潜 


新 兴 的 移动 众 包 场景 提出 一 套 完整 的 在 线 激励 机 


制 优化 算法 ,包括 改进 的 多 阶段 反 向 拍卖 入 


算法 和 信 


誉 更 新 算法 。 
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E 论 上 可 以 证 明 该 机 制 满足 计算 有 效 性 、 利 益 双 方正 收益 性 和 


真实 可 靠 性 ， 仿 真 结果 进一步 表明 ， 该 激励 机 制 能 在 一 定 的 预 
算 和 时 间 约 束 下 获得 更 好 的 局 


各 
月 E 。 
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